Dilemme du voyageur

En théorie des jeux, le dilemme du voyageur (parfois abrégé en TD ) est un jeu à somme non nulle dans lequel chaque joueur propose un gain. La plus basse des deux propositions gagne; le joueur lowball reçoit le paiement lowball plus un petit bonus, et le joueur highball reçoit le même paiement lowball, moins une petite pénalité. Étonnamment, l' équilibre de Nash est pour les deux joueurs un lowball agressif. Le dilemme du voyageur est remarquable en ce que le jeu naïf semble dépasser l’équilibre de Nash; Cet apparent paradoxe apparaît également dans le jeu des centipèdes et le dilemme du prisonnier finement itéré.

Formulation

Le scénario de jeu original a été formulé en 1994 par Kaushik Basu et se présente comme suit^[1]^,^[2] :

"Une compagnie aérienne perd deux valises appartenant à deux voyageurs différents. Les deux valises se trouvent être identiques et contiennent des antiquités identiques. Un responsable de compagnie aérienne chargé de régler les réclamations des deux voyageurs explique que la compagnie aérienne est responsable d'un maximum de 100 USD par valise - il est incapable de connaître directement le prix des antiquités. "

"Pour déterminer une valeur estimée honnête des antiquités, le responsable sépare les deux voyageurs afin qu'ils ne puissent pas se concerter et leur demande d'écrire le montant de leur valeur entre pas moins de 2 $ et plus de 100 $. Il leur dit également que si les deux écrivent le même numéro, il traitera ce numéro comme la valeur réelle en dollars des deux valises et remboursera ce montant aux deux voyageurs. Toutefois, si l’un écrit moins que l’autre, ce dernier sera considéré comme la valeur réelle et les deux voyageurs recevront ce montant avec un bonus / malus : 2 $ supplémentaires seront versés au voyageur qui a écrit la valeur inférieure et une déduction de 2 $ seront prélevées sur la personne qui a consigné le montant le plus élevé. Le défi est le suivant : quelle stratégie les deux voyageurs devraient-ils suivre pour décider de la valeur à écrire ? "

Les deux joueurs tentent d'optimiser leurs gains, sans se soucier des gains de l'autre joueur.

Analyse

On pourrait s'attendre à ce que le choix optimal du voyageur soit de 100 $; c'est-à-dire que le voyageur valorise les antiquités au prix maximum autorisé par le responsable de la compagnie. Remarquablement, et pour beaucoup, contre-intuitivement, la solution d’équilibre de Nash n’est en réalité que de 2 dollars; c'est-à-dire que le voyageur valorise les antiquités au prix minimum autorisé par le responsable de la compagnie aérienne.

Pour comprendre pourquoi 2 $ est l’ équilibre de Nash, considérons la preuve suivante:

Alice, ayant perdu ses antiquités, se voit demander leur valeur. La première pensée d'Alice est de citer 100 $, la valeur maximale autorisée.
Après réflexion, elle se rend compte que son compagnon de voyage, Bob, pourrait également citer 100 $. Alice se ravise et décide de proposer 99 dollars. Si Bob cite 100 dollars, il paiera 101 dollars.
Mais Bob, étant dans une position identique à Alice, pourrait aussi penser à citer 99 $. Alice se ravise et décide de proposer 98 dollars. Si Bob cite 99 dollars, il paiera 100 dollars. C'est plus que les 99 $ qu'Alice recevrait si elle et Bob citaient tous les deux 99 $.
Ce cycle de pensée se poursuit jusqu'à ce qu'Alice décide finalement de ne proposer que 2 $ - le prix minimum autorisé.

Une autre preuve va comme suit:

Si Alice ne souhaite que maximiser ses profits, choisir 99 $ l'emporte sur 100 $. Si Bob choisit une valeur en dollars comprise entre 2 et 98, 99 $ et 100 $ donnent le même résultat. si Bob choisit 99 $ ou 100 $, choisir 99 $ rapportera un dollar supplémentaire à Alice.
Un raisonnement similaire montre que choisir 98 $ est toujours préférable pour Alice que de choisir 99 $. Le seul cas où choisir 99 $ rapporterait plus que choisir 98 $ est le cas si Bob choisit 100 $ - mais si Bob cherche seulement à maximiser ses propres profits, il choisira toujours 99 $ au lieu de 100 $.
Ce raisonnement peut être appliqué à toutes les options en dollars d’Alice jusqu’à ce qu’elle atteigne enfin 2 $, le prix le plus bas.

Résultats expérimentaux

Le résultat (2 $, 2 $) dans ce cas est l’ équilibre de Nash du jeu. Par définition, cela signifie que si votre adversaire choisit cette valeur d’équilibre de Nash, votre meilleur choix est cette valeur d’équilibre de Nash de 2 $. Ce ne sera pas le choix optimal s'il y a une chance pour que votre adversaire choisisse une valeur supérieure à 2 $^[3]. Lorsque le jeu est joué à titre expérimental, la plupart des participants choisissent une valeur supérieure à l'équilibre de Nash et plus proche de 100 $ (correspondant à la solution optimale de Pareto). Plus précisément, la solution de stratégie d’équilibre de Nash s’est révélée être un mauvais prédicteur du comportement des personnes face au dilemme d’un voyageur, avec un bonus / malus faible, et un prédicteur plutôt bon si le paramètre bonus / malus était important^[4].

De plus, les voyageurs sont récompensés en s'écartant fortement de l'équilibre de Nash dans le jeu et obtiennent des récompenses bien supérieures à celles qui seraient obtenues avec la stratégie purement rationnelle. Ces expériences (et d'autres, telles que les points focaux ) montrent que la majorité des gens n'utilise pas de stratégies purement rationnelles, mais que les stratégies qu'elles utilisent sont manifestement optimales. Ce paradoxe pourrait réduire la valeur de l’analyse de la théorie des jeux pure, mais pourrait également indiquer l’avantage d’un raisonnement élargi qui comprend comment il peut être assez rationnel de faire des choix non rationnels, du moins dans le contexte de jeux où les joueurs peuvent compter sur ne pas jouer "rationnellement". Par exemple, Capraro a proposé un modèle dans lequel les êtres humains n'agissent pas a priori comme des agents uniques, mais ils prévoient comment le jeu serait joué s'ils formaient des coalitions, puis agissaient de manière à maximiser les prévisions. Son modèle correspond assez bien aux données expérimentales sur le dilemme du voyageur et à des jeux similaires^[5]. Récemment, le dilemme du voyageur a été mis à l’épreuve avec une décision prise en groupe plutôt qu’individuellement, afin de vérifier l’hypothèse voulant que les décisions de groupe soient plus rationnelles, en donnant le message que, en général, deux têtes valent mieux qu’une^[6]. Les résultats expérimentaux montrent que les groupes sont toujours plus rationnels - c'est-à-dire que leurs revendications sont plus proches de l'équilibre de Nash - et plus sensibles à la taille du bonus / malus^[7].

Certains joueurs semblent poursuivre un équilibre de Nash bayésien^[8]^,^[9].

Jeux similaires

Le dilemme du voyageur peut être assimilé à celui d'un prisonnier finement répété^[8]^,^[9]. Des paradoxes similaires sont attribués au jeu des centipèdes et au jeu du concours p-beauté ^[7] (ou plus précisément, " Devinez 2/3 de la moyenne "). Une variante du dilemme du voyageur original dans laquelle deux choix entiers, à 2 $ ou 3 $, est proposée aux deux voyageurs est mathématiquement identique au dilemme standard du prisonnier non itéré. Le dilemme du voyageur peut donc être considéré comme un prolongement du dilemme du prisonnier. Ces jeux impliquent généralement une suppression itérative profonde des stratégies dominées afin de démontrer l'équilibre de Nash et conduisent à des résultats expérimentaux s'écartant nettement des prédictions classiques de la théorie des jeux .

Références

↑ Kaushik Basu, "The Traveler's Dilemma: Paradoxes of Rationality in Game Theory"; American Economic Review, Vol. 84, No. 2, p. 391–395; May 1994.
↑ Kaushik Basu,"The Traveler's Dilemma"; Scientific American, June 2007
↑ Wolpert, « Schelling Formalized: Strategic Choices of Non-Rational Personas », Social Science Research Network,‎ 1^er septembre 2009
↑ Capra, Goeree, Gomez et Holt, « Anomalous Behavior in a Traveler's Dilemma? », The American Economic Review, vol. 89, n^o 3,‎ 1^er janvier 1999, p. 678–690 (DOI 10.1257/aer.89.3.678, JSTOR 117040)
↑ Capraro, « A Model of Human Cooperation in Social Dilemmas », PLoS ONE, vol. 8, n^o 8,‎ 2013, e72427 (DOI 10.1371/journal.pone.0072427, arXiv 1307.4228)
↑ Cooper et Kagel, « Are Two Heads Better Than One? Team versus Individual Play in Signaling Games », American Economic Review, vol. 95, n^o 3,‎ 1^er juin 2005, p. 477–509 (ISSN 0002-8282, DOI 10.1257/0002828054201431, lire en ligne)
↑ ^{a et b} Morone, Morone et Germani, « Individual and group behaviour in the traveler's dilemma: An experimental study », Journal of Behavioral and Experimental Economics, vol. 49,‎ 1^er avril 2014, p. 1–7 (DOI 10.1016/j.socec.2014.02.001)
↑ ^{a et b} (en) T. Becker, M. Carter et J.Naeve, Experts Playing the Traveler's Dilemma, University of Hohenheim, 2005. .
↑ ^{a et b} Baader et Vostroknutov, « Interaction of reasoning ability and distributional preferences in a social dilemma », Journal of Economic Behavior & Organization, vol. 142,‎ octobre 2017, p. 79–91 (DOI 10.1016/j.jebo.2017.07.025)

[1] Kaushik Basu, "The Traveler's Dilemma: Paradoxes of Rationality in Game Theory"; American Economic Review, Vol. 84, No. 2, p. 391–395; May 1994.

[2] Kaushik Basu,"The Traveler's Dilemma"; Scientific American, June 2007

[Wolpert-3] Wolpert, « Schelling Formalized: Strategic Choices of Non-Rational Personas », Social Science Research Network,‎ 1^er septembre 2009

[capra-4] Capra, Goeree, Gomez et Holt, « Anomalous Behavior in a Traveler's Dilemma? », The American Economic Review, vol. 89, n^o 3,‎ 1^er janvier 1999, p. 678–690 (DOI 10.1257/aer.89.3.678, JSTOR 117040)

[Capraro-5] Capraro, « A Model of Human Cooperation in Social Dilemmas », PLoS ONE, vol. 8, n^o 8,‎ 2013, e72427 (DOI 10.1371/journal.pone.0072427, arXiv 1307.4228)

[6] Cooper et Kagel, « Are Two Heads Better Than One? Team versus Individual Play in Signaling Games », American Economic Review, vol. 95, n^o 3,‎ 1^er juin 2005, p. 477–509 (ISSN 0002-8282, DOI 10.1257/0002828054201431, lire en ligne)

[morone-7] {a et b} Morone, Morone et Germani, « Individual and group behaviour in the traveler's dilemma: An experimental study », Journal of Behavioral and Experimental Economics, vol. 49,‎ 1^er avril 2014, p. 1–7 (DOI 10.1016/j.socec.2014.02.001)

[becker-8] {a et b} (en) T. Becker, M. Carter et J.Naeve, Experts Playing the Traveler's Dilemma, University of Hohenheim, 2005. .

[baader-9] {a et b} Baader et Vostroknutov, « Interaction of reasoning ability and distributional preferences in a social dilemma », Journal of Economic Behavior & Organization, vol. 142,‎ octobre 2017, p. 79–91 (DOI 10.1016/j.jebo.2017.07.025)

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

v · m Théorie des jeux
Définitions	Détermination Escalade d'engagement Extensive-form game (en) First-player and second-player win (en) Game complexity (en) Graphical game (en) Hierarchy of beliefs (en) Information set (en) Jeu bayésien Jeu coopératif Jeu résolu Jeu sous forme normale Préférence Jeu séquentiel Simultaneous game (en) Simultaneous action selection (en) Succinct game (en)
Équilibre économique (concepts)	Équilibre de Nash Équilibre parfait en sous-jeux Mertens-stable equilibrium (en) Bayesian Nash equilibrium (en) Perfect Bayesian equilibrium (en) Trembling hand (en) Proper equilibrium (en) Epsilon-equilibrium (en) Équilibre corrélé Équilibre séquentiel Quasi-perfect equilibrium (en) Stratégie évolutivement stable Risk dominance (en) Cœur Valeur de Shapley Optimum de Pareto Quantal response equilibrium (en) Self-confirming equilibrium (en) Strong Nash equilibrium (en) Markov perfect equilibrium (en)
Stratégies	Dominance stratégique Stratégie pure Stratégie mixte Strategy-stealing argument (en) Coopération-réciprocité-pardon Grim trigger (en) Collusion Raisonnement rétrograde Induction vers l'avant Stratégie de Markov (en)
Classes de jeux	Symmetric game (en) Perfect information (en) Repeated game (en) Signaling game (en) Screening game (en) Conversation libre Jeu à champ moyen Jeu à somme nulle Théorie des mécanismes d'incitation problèmes de négociation Stochastic game (en) n-player game (en) Large Poisson game (en) Nontransitive game (en) Global game (en) Strictly determined game (en) Jeu de potentiel
Jeux	Dilemme du prisonnier Dilemme facultatif du prisonnier Dilemme du voyageur Jeu de coordination Stratégie du bras de fer Jeu du mille-pattes Dilemme du volontaire Enchère d'un dollar Jeu de la guerre des sexes Chasse au cerf Jeu de l'appariement des sous Jeu de l'ultimatum Pierre-papier-ciseaux Jeu du pirate Jeu du dictateur Jeu des biens publics Jeu Blotto Guerre d'usure Problème du bar d'El Farol Partage équitable Fair cake-cutting (en) Cournot game Deadlock (en) Dilemme du dîner Concours de beauté de Keynes Poker Kuhn (en) Jeu de marchandage de Nash Prisoners and hats puzzle (en) Jeu de la princesse et du monstre Problème de Monty Hall Problème du rendez-vous
Theorèmes	Algorithme minimax Équilibre de Nash Purification theorem (en) Folk theorem (en) Revelation principle (en) Théorème d'impossibilité d'Arrow
Personnalités	Albert W. Tucker Amos Tversky Ariel Rubinstein Daniel Kahneman David K. Levine (en) David M. Kreps Donald B. Gillies (en) Drew Fudenberg Eric Maskin Harold W. Kuhn Herbert Simon Hervé Moulin Jean Tirole Jean-François Mertens (en) John Harsanyi John Maynard Smith Antoine-Augustin Cournot John Nash John von Neumann Kenneth Arrow Kenneth Binmore Leonid Hurwicz Lloyd Shapley Melvin Dresher (en) Merrill M. Flood (en) Oskar Morgenstern Paul Milgrom Peyton Young (en) Reinhard Selten Robert Axelrod Robert Aumann Robert B. Wilson Roger Myerson Samuel Bowles (en) Thomas Schelling William Vickrey
Voir aussi	All-pay auction (en) Élagage alpha-bêta Paradoxe de Bertrand Rationalité limitée Théorie des jeux combinatoires Confrontation analysis (en) Coopétition Liste des théoriciens du jeu Liste des jeux en théorie des jeux Perdant-perdant Topological game (en) Tragédie des biens communs Tyrannie des petites décisions